本章讨论了一个组中的工作项如何交流和合作以提高某些类型内核的性能。\par

首先讨论了ND-Range内核和分层内核如何支持将工作项分组到工作组中。讨论了如何将工作项分组到工作组中，从而更改并行执行模型，以确保工作组中的工作项并发执行，并支持通信和同步。\par

接下来，讨论了工作组中的工作项如何使用barrier进行同步，以及如何在ND-Range内核中显式地表示barrier，或者在分层内核的工作组和工作项范围中隐式地表示barrier。还讨论了如何通过工作组本地内存执行工作组中工作项之间的通信，以简化内核并提高性能，以及如何使用用于ND-Range内核的本地访问器来表示工作组本地内存，以及如何使用分层内核工作组范围内的本地内存。\par

讨论了如何将ND-Range内核中的工作组进一步划分为子工作组，其中子工作组可能支持其他的通信模式或调度。\par

对于工作组和子工作组，我们讨论了如何通过使用集合功能来表达和加速公共通信模式。\par

本章中的概念是理解第14章中描述的常见并行模式，以及理解第15、16和17章中如何针对特定设备进行优化的基础。\par


\newpage